使用单镜相机完成3D语义场景完成的任务在自动驾驶领域受到了极大的关注。此任务旨在预测部分图像输入中3D场景中每个体素的现场状态和语义标签。尽管存在许多方法,但许多人都面临着诸如不准确预测对象形状和错误分类对象边界的挑战。为了解决这些问题,我们提出了Depthssc,这是一种仅使用单眼摄像机完成语义场景的高级方法。DEPTHSSC与几何感知体素化(GAV)集成了SpaTial变换图融合(ST-GF)模块,从而使Voxel分辨率的动态调整能够适应3D空间的几何复杂性。这确保了空间和深度信息之间的精确比对,从而有效地减轻了诸如对象边界畸变和以前方法中发现的深度不正确感知之类的问题。对Semantickitti和sscbench-Kitti-360数据集的评估表明,DepthSSC不仅有效地捕获了复杂的3D结构细节,而且还可以实现最先进的性能。
主要关键词
![arxiv:2311.17084v2 [cs.cv] 2024年11月25日PDF文件第1页](/bimg/b/b13dda59aa85a0f9497ab7c09f2da4f410e56bd4.webp)
![arxiv:2311.17084v2 [cs.cv] 2024年11月25日PDF文件第2页](/bimg/4/471fc76ee9e859939f5acd3f127398c600937f56.webp)
![arxiv:2311.17084v2 [cs.cv] 2024年11月25日PDF文件第3页](/bimg/f/feb6a6b9767e2726cea26a42cd990498036d863c.webp)
![arxiv:2311.17084v2 [cs.cv] 2024年11月25日PDF文件第4页](/bimg/f/fb9221b368184275a8e450d3e51512373ac82132.webp)
![arxiv:2311.17084v2 [cs.cv] 2024年11月25日PDF文件第5页](/bimg/2/2940e0a06b4eea4e17268c55ebb60836e0ec56df.webp)
